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Методы синхронизации потоков данных 
в структурной составляющей параллельной 
программы на языке СОГАМО 


В статье рассматриваются особенности языка высокого уровня СОГАМО и возможность его применения 
для программирования реконфигурируемых вычислительных систем. Приведены методы синхронизации 
потоков данных в структурной составляющей параллельной программы на языке СОГАМО. 


Применение реконфигурируемых вычислительных систем (РВС) для решения 
задач различных классов, таких как линейная алгебра, математическая физика, сим- 
вольная обработка, зачастую оказывается гораздо более эффективным по сравнению 
с использованием традиционных многопроцессорных вычислительных систем (МВС) 
кластерной архитектуры. 

Вместе с тем широкое использование РВС сдерживается сложностью их програм- 
мирования, так как помимо разработки параллельной программы, организующей потоки 
данных, программисту необходимо задать и конфигурацию вычислительной системы, 
на которой задача будет решаться с наибольшей эффективностью. 

Такой подход к программированию требует от программиста наличия дополни- 
тельных навыков в области проектирования вычислительных устройств на языках 
описания аппаратуры, в частности, на УНПГ, что, как правило, приводит к необхо- 
димости подключения специалистов-схемотехников к программированию прикладной 
задачи на РВС. Для описания схемотехнической реализации и организации потоков 
данных в РВС в едином синтаксисе разработан и используется язык программирова- 
ния высокого уровня СОГАМО [1]. 

Целью настоящей статьи является рассмотрение языка высокого уровня 
СОГАМО и основных этапов трансляции параллельных программ на языке СОГАМО в 
структурную составляющую, представляющую собой аппаратную реализацию инфор- 
мационного графа, адекватного структуре транслируемой задачи. Особое внимание 
уделено проблеме синхронизации и стробировании потоков данных в информационном 
графе структурной составляющей параллельной программы. 

Фундаментальным типом вычислительной структуры в языке СОГАМО является 
конструкция «кадр». Кадром является программно-неделимая компонента, представ- 
ляющая собой совокупность арифметико-логических команд, выполняемых на различных 
элементарных процессорах, обладающих распределенной памятью и соединенных 
между собой в соответствии с информационной структурой алгоритма таким образом, 
что вычисления производятся с максимально возможными параллелизмом и асин- 
хронностью. Кадр фактически определяет вычислительную структуру и потоки данных 
в РВС в данный момент времени. При этом все операции в теле кадра выполняются 
асинхронно с максимальным параллелизмом, а последовательность смены кадров 
однозначно определяется программистом. 
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В языке отсутствуют явные формы описания параллелизма. Распараллеливание 
достигается с помощью объявления типов доступа к переменным и индексации эле- 
ментов массивов. Для исключения конфликтов одновременного чтения и записи ячеек 
памяти в пределах текущего кадра используется широко распространенное в языках 
потока данных правило единственной подстановки: переменная, хранящаяся в памяти, 
может получить значение в кадре только один раз. 

Для обращения к данным используются два основных метода доступа: парал- 
лельный доступ (задаваемый типом Уесюг) и последовательный доступ (задаваемый 
типом Э#геап). На рис. 1 представлены программы, являющиеся граничными приме- 
рами извлечения параллелизма, и графы синтезируемых вычислительных структур. 


УАВ А,В,С: Пцеоег [10 : Уесог] Мет; УАВ А,В.С : Песег [10 : Згеат] Мет; 


УАВ Г: Митфег; УАВ Г: Митфег; 
САОК ЗишшаУес(ог; САОК Зишшта$ еат; 
Еог [:= 009 4 Рог [ := 0 ю9 40 
СШ =АП-+ВП]; С :=А +В}; 
ЕМОСАОВ; ЕМОСАОВ; 


с | сш С] 


6) 
Рисунок 1 — Параллельное и последовательное сложение массивов 


Тип доступа Этеат указывает на последовательную обработку элементов одно- 
мерного массива, а тип Уесюг позволяет обрабатывать элементы одномерного массива 
одновременно. 

Многомерные массивы состоят из множества измерений, каждое из которых мо- 
жет иметь последовательный или параллельный тип доступа, задаваемый ключевым 
словом Эеат или Уесюог соответственно. 

Применение неявного описания параллелизма за счет задания типа доступа по- 
зволяет достаточно просто управлять степенью распараллеливания программы, на уровне 
описания структур данных дает возможность программисту максимально просто опи- 
сывать различные виды параллелизма в достаточно сжатом виде. 

Трансляция программы на языке высокого уровня СОГАМО состоит в создании 
схемотехнической конфигурации вычислительной системы (структурной составляю- 
щей) и параллельной программы, управляющей потоками данных (потоковой и про- 
цедурной составляющих). 

Создание структурной составляющей заключается в построении информацион- 
ного графа, соответствующего описанным на СОГАМО информационным зависимос- 
тям между результатами вычислений. При этом для каждой используемой в тексте 
программы операции подставляется специализированный вычислительный блок в 
зависимости от типа доступа к переменным, типа данных и т.д. Синтезированный 
информационный граф задачи передается в среду разработки вычислительных структур 
Еше!Сопзгасог для укладки на множество ПЛИС РВС и обеспечения синхронизации 
между ПЛИС [2]. 

Результатом работы среды Еше!Сопзгасюг являются файлы УНОГ-описаний 
для корпусов ПЛИС, содержащих синхронизированные между собой фрагменты вы- 
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числительного графа задачи. Каждый из созданных файлов далее передается в среду 
проектирования ХШих ГЗЕ, в результате работы которой создаются схемотехничес- 
кие конфигурации для каждого корпуса. 

Во время синтеза информационного графа транслятор СОГАМО выполняет оп- 
тимизацию созданного графа, в частности, для сокращения числа ярусов арифмети- 
ческого выражения путем преобразования его в ярусно-параллельную форму (ЯПФ). 

Преобразование арифметического выражения к ЯПФ ориентировано на обработку 
произвольных комбинаций арифметических операций и последующего построения 
арифметического выражения в виде дерева, корнем которого является итоговый ре- 
зультат арифметического выражения. 

Алгоритм преобразования арифметического выражения к ЯПФ состоит из следую- 
щих основных шагов: обработки вычислительных операций математического выра- 
жения и представления математического выражения в виде дерева. 

Обработка вычислительных операций математического выражения заключается в: 
— определении необходимого количества проходов и по обрабатываемому выражению; 
— обработке к-й операции, где к — номер арифметической операции от начала выражения. 

Количество проходов и определяется как максимальное значение п, при котором 


СоиптЮрегайоп 


2 


таноп > = 2, в противном случае и = 0, где Сочи Орегайоп — количество вычислитель- 
ных операций (суммирования и вычитания) в математическом выражении. 

Правило обработки к-й операции. 

Обработка выражения начинается со второй операции в выражении (то есть к = 2). 

В зависимости от значения к-й операции от начала выражения будет зависеть 
значение операции т = к+2”. Если к-я операция имеет значение бинарной операции 
вычитания, а операция с номером т = к+2" имеет тот же приоритет, что и операция 
к, то значение операции т = к+2" меняется на противоположное. 

Во всех остальных случаях выполняется переход на операцию с номером т = 
=. и 

Построение дерева математического выражения (рис. 2): 
— на первой итерации все исходные данные математического выражения разбиваются 
на пары, и для каждой пары вычисляется их значение; 
— далее все полученные значения пар также разбиваются на пары, и снова выполня- 
ется вычисление значений пар и т.д. 


—1 
выполняется следующее условие: 2” <= | при условии, что СоипЮре- 


АЛ В1 А? В2 АЗ В3 А4 Ва АБ В5 Аб Вб А?’ В7 АЗ В8 


Рисунок 2 — Дерево математического выражения 


Построенное дерево представляет собой информационный граф математичес- 
кого выражения, вершинами которого являются операционные вершины (элементарные 
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процессоры) и информационные вершины (информационные вершины -— контроллеры 
распределенной памяти, регистры и т.д.), а дугами — потоки данных. 

После построения информационного графа транслятор выполняет синхрониза- 
цию и стробирование потоков данных в графе. 

Синхронизация потоков данных в информационном графе осуществляется рас- 
становкой временных задержек. 

Элементы временных задержек по функциональному назначению подразделя- 
ются на следующие: 

а) задержка операционной вершины графа; 

6) алгоритмическая задержка (ПШегепсетадех); 

в) синхронизационная задержка (Кое®. 

Элемент задержки операционными вершинами графа определяется латентнос- 
тью данной вершины и применяется для синхронизации потоков данных между опе- 
рационными вершинами информационного графа. Расстановку элементов задержек, 
вносимых операционными вершинами графа, выполняет среда Еие!Сопзегасюг. 

Элемент алгоритмической задержки определяется алгоритмом задачи и возни- 
кает при одновременном доступе к различным элементам массива, расположенным в 
одном канале памяти. 

Элемент синхронизационной задержки используется для согласования различных 
алгоритмических задержек между различными контроллерами распределенной памя- 
ти с целью выравнивания потоков данных. 

Таким образом, для синхронизации потоков данных в информационном графе 
на этапе трансляции параллельной программы транслятор выполняет расчет временной 
задержки для каждого канала памяти путем суммирования алгоритмической и син- 
хронизационной задержек. 

Алгоритм расчета временных задержек выглядит следующим образом: 

а) Выполнить определение множества МахМи = {У\о, Ут, ... У, где п — коли- 
чество информационных вершин, а У; — это кортеж <Уапае, О!егепсетдех>, в ко- 
тором УанаЫе — соответствует информационной вершине информационного графа; 

Ь) Выполнить расчет значения ОШегепсешта4ех для всех элементов множества 
МахМиш: 

с) Определить максимальный кортеж М из множества МахМ; 

4) Выполнить расчет Ко для всех элементов множества МахМи относитель- 
но кортежа М; 

е) Вычислить Оеау = ОШегепсетаех + КоеЁ для всех элементов множества МахМи; 

Г) Выполнить расстановку вычисленных временных задержек для всех дуг ин- 
формационного графа, принадлежащих картежу У; из множества МахМи. 

На рис. 3 показан информационный граф программы с расставленными времен- 
ными задержками. 

Здесь квадратные блоки соответствуют входным и выходным информационным 
вершинам графа. 

Вершины графа, обозначенные светлыми кружками, являются арифметико-ло- 
гическими операциями, реализованными на ЭП, а вершины, обозначенные в виде светлого 
прямоугольника ‚ указывают на элемент алгоритмической временной задержки 
информации на определенное число тактов, а в виде заштрихованного прямоуголь- 
ника [7570 - на элемент синхронизационной временной задержки. 

В полученном информационном графе выполняется замена арифметических опе- 
раций (сложения, умножения, деления и т.д.) на эквивалентные им библиотечные 
элементы (сумматор, умножитель, делитель и т.д.). 
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УАК А,В,С.О : Пщесег [100 : Згеат] т АГ] 
Мет; |+) ("у О 
УАВ Г: МиштфЬег; А” 
САОВ Зиштатеат; 
Еог [:= 5 ® 90 4 В 257 

Р]:=(АШ-+АП-5])+В[)*(СП]-СП-2]; 
ЕМОСАОВ; 

| И 

с 
[Я 


Рисунок 3 — Программа и эквивалентный ей информационный граф 
с расставленными временными задержками 


Для корректной обработки потоков данных, проходящих через информацион- 
ный граф, представленный в виде библиотечных элементов, необходимо выполнить 
стробирование потоков данных. 

Стробирование данных осуществляется сигналом «Маркер», который подключен 
к определенным библиотечным элементам в информационном графе и сопровождает 
поток данных, указывая на их валидность. 

Алгоритм подключения «Маркеров» в информационном графе выглядит следую- 
щим образом: 

— Найти независимые информационные подграфы в информационном графе; 

— Определить множество МахМ согласно пункту а) алгоритма расчета временных 
задержек, вносимых данными для всех информационных вершин информационного 
подграфа; 

— Вычислить максимальный кортеж М из множества МахМ; 

— Найти информационную вершину в подграфе, соответствующую кортежу М; 

— Выполнить перебор всех вершин подграфа и подключить соответствующий биб- 
лиотечным элементам сигнал «Маркер». 

На рис. 4 показан информационный граф, представленный в виде библиотечных 
элементов с подключенными сигналами «Маркер», где к блоку КРП С на вход МП 
подключен сигнал «Маркер» блока КРП А с выхода МО. 


‘100’ 


КРПА КРПС 


Рисунок 4 — Информационный граф с подключенными сигналами «Маркер» 


Полученный информационный граф, представленный в виде специализированных 
функциональных библиотек, передается в среду разработки вычислительных структур 
Еше!Сопзгасюг, которая выполняет размещение данного графа задачи на архитектуру 
МВС. Результат представления информационного графа в среде Еие!Сопзгасюг пред- 
ставлен на рис. 5. 
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Рисунок 5 — Информационный граф задачи в среде Еше!Сопзгасюг 


Среда Епе!Сопягасюг выполняет размещения информационного графа задачи 
на архитектуру РВС и его трансляцию в УНОГ-описание, используемое для создания 
конфигурационных файлов, загружаемых в ПЛИС РВС. 

Такой подход программирования реконфигурируемых вычислительных систем 
освобождает программиста от построения графа задачи в виде функциональных биб- 
лиотек в среде Епе!Сопзгасюог и организации потоков данных в РВС, сократив время 
создания параллельных программ для РВС в 3 - 10 раз, и исключает участие специа- 
листа-схемотехника при разработке параллельных прикладных программ. 


Литература 


1. Реконфигурируемые мультиконвейерные вычислительные структуры [Каляев И.А., Левин И.И., 
Семерников Е.А., Шмойлов В.И.] / [под облщ. ред. И.А. Каляева]. — Ростов н/Д : Издательство ЮНЦ 
РАН, 2008. — 320 с. 

2. Гуленок А.А. Среда разработки масштабируемых компонентов вычислительных структур и отоб- 
ражения их на архитектуру реконфигурируемых систем / А.А. Гуленок // Материалы Третьей еже- 
годной науч. конф. студентов и аспирантов базовых кафедр ЮНЦ РАН. - Ростов-на-Дону : Изд-во 
ЮНЦРАН, 2007. — С. 136-137. 


В.О. Гудков 

Методи синхронзацй поток!в даних у структурнй складовй 

паралельно! програми мовою СОГАМО 

У дашй статт! розглядаються особливост! мови високого равня СОГАМО та можливисть Й використання 
для програмування реконфгурруемих обчислювальних систем. Наведен! методи синхронзацй поток!в 
даних у структуры! складов1й паралельно! програми мовою СОГАМО. 
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